이 포스트는 저자의 블로그에서도 만나보실 수 있습니다.
Introduction
- 안녕하세요, “실무로 통하는 인과추론 with 파이썬”을 번역한 신진수입니다.
- 가짜연구소 인과추론팀과 함께 번역한 이 책은 종이책/E-book 모두 출간되었습니다. 왼쪽의 책 이미지를 클릭해주세요!
- 이 포스트에서는 간단한 책 소개와 저의 첫 번역서에 대한 자료 및 소통 채널을 안내드리려고 합니다.
책 소개
모든 기업에서의 화두는 “제품의 성장”일 것입니다. 데이터 분석가와 과학자들은 데이터를 활용해 고객 경험을 개선함으로써 제품 성장을 이끌고 있죠. 이 과정에서 원인에 개입해 그 효과를 분석하는 인과추론은 중요한 역할을 합니다. 인과추론은 더 중요해지고 있지만, 한국어 자료는 매우 부족합니다.
이런 맥락에서 이 책은 “여전히 한국어 학습자료가 많지 않은 상황에서 인과추론에 입문하고자 하는 분들에게 가뭄에 단비 같은 자료가 될 것입니다”(박지용 교수님 서문 인용).
이 번역서는 데이터 과학자의 시각에서 인과추론의 기초부터 심화에 이르기까지의 내용을 다양한 사례를 통해 배울 수 있게 돕습니다. 각 장에 실린 사례 연구와 예제들은 이론을 실무에 어떻게 적용하는지 보여주며, 파이썬 코드로 제공되어 쉽게 따라 할 수 있습니다. 특히, 인과추론 방법론뿐만 아니라 실무에서 고민할 수 있는 문제인 인과효과의 신뢰성 검증 및 추론 과정까지 다룹니다. 인과추론을 처음 접하는 분부터 실무에 적용하려는 데이터 분석가와 과학자까지 모두를 만족시킬 수 있을 겁니다(옮긴이의 말 인용).
이 책의 주요 내용은 다음과 같습니다.
- 인과추론의 기본 개념과 활용법 익히기
- 인과추론과 편향의 관계 이해하기
- 인과추론으로 비즈니스 문제 해결하기
- 인과추론으로 고객을 시간에 따라 관찰하기
- 인과효과가 실험 대상마다 다를 수 있는 이유 학습하기
“실무로 통하는 인과추론 with 파이썬”을 통해, 독자 여러분들이 인과추론의 이해를 한층 더 높이고 인과추론에 대한 문턱을 낮춤으로써, 독자 여러분 개인의 삶과 조직에서의 의사결정에 큰 도움이 되기를 바랍니다.
추천의 말
이 책은 통계와 머신러닝에 관한 수학과 이론에 치우치지 않으면서 인과추론의 핵심 개념을 이해하기 쉽게 설명하며, 최신 연구 결과들까지도 충실히 담고 있습니다. 또한 파이썬 실습을 통해 실무적이고 실전적인 학습을 균형 있게 다루는 만큼, 곁에 두고 필요할 때 찾아볼 수 있는 지침서이자 참고서로서도 손색이 없습니다. 인과추론에 입문하는 연구자들과 현업 데이터 분석가 여러분께 강력하게 권합니다. <박지용 - 조지아대학교 경영정보학 교수>
크래프톤에서 퍼블리싱하는 수많은 게임 사용자의 데이터를 해석하는 데 있어 인과추론은 핵심적인 역할을 합니다. 이 책은 이러한 중요한 주제를 실용적이고 접근하기 쉬운 방식으로 설명하며, 데이터 과학자가 실제 문제에 적용할 수 있는 귀중한 지식을 제공합니다. 데이터 분석을 포함한 다양한 엔지니어링 부서를 맡고 있는 부서장으로서 이 책을 강력히 추천합니다. <이석찬 - 크래프톤 엔지니어링 본부장>
이 책은 제가 넷플릭스의 추천 알고리즘팀과 우버의 마케팅 응용과학팀에서 실무에 적용했던 성향점수 역확률 가중치, 메타러너, 스위치백, 도구변수 등과 같은 다양한 인과추론 방법론을 소개합니다. 특히 대부분의 인과추론 입문서가 경제학 배경지식을 요구하거나 전공 과목 교과서처럼 구성된 것과 달리, 이 책은 복잡한 수식과 증명보다는 파이썬 코드와 실무 예제를 중심으로 구성되어 있습니다. 따라서 경제학적 배경지식이 없는 데이터 관련 실무진들이나 다른 전공 학생들도 인과추론 방법론의 개념을 쉽게 이해하고 실습해볼 수 있습니다. <이정윤 - 우버 마케팅 응용과학팀 시니어 매니저, CausalML 오픈소스 운영자>
기존 번역서와의 차이점
✔ 마테우스의 두 책을 번역한 사람으로서 Causal Inference for the brave and true와 다음과 같은 차이가 있습니다.
- 마케팅 및 금융 사례를 바탕으로 실무자인 데이터 분석가/과학자의 관점에서 내용이 재구성되어 독자 입장에서 이해하기 쉬울 거예요.
- 실무자가 고려해야할 부분에 대한 내용인 1) 실험 설계/방법론 선택 2) 결과의 신뢰성/해석이 추가되었습니다(ex. 10장 스위치백 실험). 이 과정에서 원저자의 조언도 함께 반영되어 있습니다.
- 인과추론의 핵심인 식별 가정(ex. 1.6 인과효과 식별)에 대한 설명과 수식이 더 구체적으로 기술되어 있으며, 실험 방법론에 대해 다양한 관점(ex. 8.3 이중차분법 식별)에서 접근합니다.
- 제가 데이터 분석가로 근무하며 다양한 분석과 실험을 통해, 저의 생각이 담긴 “에필로그”가 들어가있습니다.
번역서 자료 & 소통 채널
인과추론이나 실무 용어에 익숙하지 않은 분들을 위해 주석을 추가했지만, 독자분들이 어려워할 수 있는 부분들이 있을 것이라고 생각됩니다.(ex. 4.3 FWL 정리, 8.7 시차 도입 설계 등). 번역서의 내용을 더 잘 이해하실 수 있도록 도움이 될 추가 자료와 컨텐츠를 제공할 예정이니 걱정하지 않으셔도 됩니다. 또한, 이 책에 언급된 논문과 모든 자료/소스 코드는 이 Github에 정리해 두었습니다. 제가 꼼꼼하게 정리했지만, 만약 누락되거나 잘못된 부분이 있다면, 다음 채널을 통해 알려주세요!
참고로 가짜연구소 인과추론팀은 해당 번역서를 기반으로 다양한 프로젝트를 진행하고 있습니다. 해당 프로젝트에 대한 청강은 가짜연구소 Discord를 확인해주세요.
Conclusion
한국에서 실무자 관점의 인과추론을 소개하는 첫 서적인 만큼, 인과추론 커뮤니티를 이끌어 가는 사람 중 한 명으로서, 접근성 있는 번역을 통해 사회적 책임을 다하려고 노력했습니다. 그럼에도 부족한 부분이 있을 수 있습니다. 이는 제 미흡함에서 비롯된 것이므로, 독자 여러분과 공유한 채널을 통해 지속적으로 소통하며 개선해 나갈 예정입니다. 그럼 책을 통해 만나요!